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摘 要 : 


[ 目的 /意义 ] 针 对 当前 非 正式 信息 交流 主题 演化 研究 在 分 析 层 次 和 测度 指标 两 方面 存在 的 局 限 ,提出 一 种 具有 通 

用 性 的 演化 分 析 方法 ,从 微观 和 中 观 层 面 探究 主题 演化 特征 与 规律 。[ 方法 /过程 ] 引 入 会 话 分 析 理 论 , 以 新 浪 微 
博 和 知 乎 为 例 , 通 过 对 主题 和 主题 徐 运 行 过 程 进行 分 析 , 从 会 话 内 容 和 讨论 方式 两 个 维度 揭示 非 正 式 信息 交流 演 
化 特征 与 规律 。 同 时 ,设计 主题 持续 性 计算 判定 方法 ,丰富 主题 演化 的 衡量 标准 。[ 结果 /结论 ] 主题 演化 分 析 结 
果 显示 新 浪 微 博 和 知 乎 意见 群体 的 发 文 主题 存在 明显 偏重 , 且 表 明了 意见 群体 参与 社会 焦点 事件 讨论 中 观点 的 
主要 切入 角度 ;主题 猴 演 化 分 析 发 现 了 新 浪 微 博 意见 群体 在 一 定 范围 内 发 散 探索 多 元 主题 、 知 乎 意见 群体 始终 关 
注 聚 焦 核 心 主题 的 讨论 特点 。 两 个 社交 媒体 中 意见 群体 在 会 话 内 容 和 讨论 方式 方面 的 区 别 , 喻 示 了 新 浪 微 博 和 
知 乎 在 网 络 环境 的 非 正式 信息 交流 中 主要 承担 的 角色 差异 。 
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间 角 度 对 主题 持续 性 的 考察 。 会 话 分 析 研 究 为 非 正式 
言 息 交 流 分 析 提 供 了 社会 学 理论 基础 ,但 在 社交 媒体 


加 3 随 着 互联 网 技术 发 展 和 受到 COVID-19 疫情 影响 ， 
丘 讲 式 信息 交流 大 量 迁 移 并 越发 活路 于 社交 媒体 平台 
中 之 在 社交 媒体 中 大 量 生 成 裂变 传播 并 迅速 更 新 的 
PEERKE User Generated Content, UGC ) 里 ,潜藏 
KER EEEE, ACTI T HE ERES TL 
m 。 基 于 社交 媒体 客观 记录 的 痕迹 数据 ,全 面 
刻画 主题 演化 趋势 .深入 探究 主题 演变 规律 ,有 助 于 准 


中 的 应 用 尚 处 于 起 步 阶 段 。 基 于 此 ,本 文 引入 会 话 分 
析 理 论 解析 主题 和 主题 篮 演化 运行 过 程 ,结合 主题 持 
续 性 概念 内 涵 测度 及 判定 标准 的 界定 ,以 期 从 微观 和 
中 观 层面 深入 探究 非 正式 信息 交流 演化 过 程 及 特征 规 
律 ,为 优化 完善 社交 媒体 平台 中 网 络 与 情 管理 的 沟通 
交流 策略 提供 参考 。 实 证 分 析 中 ,以 新 浪 微 博 和 知 乎 
平台 为 数据 来 源 ,将 UGC 视 作 基 于 社交 媒体 的 非 正 式 


确 把 握 非 正式 信息 交流 的 特征 规律 ,应 用 于 具体 情境 
中 可 为 与 情 智能 监控 ,个 性 化 内 容 推 荐 等 提供 服务 参 
考 。 

现 有 研究 中 ,各 类 主题 识别 方法 研究 成 果 较 为 丰 
富 ,为 本 研究 的 开展 提供 了 技术 保障 。 主 题 演化 研究 
从 多 个 方面 深化 拓展 ,但 在 分 析 层 次 方面 相对 宏观 , 集 
中 于 以 主题 为 表征 的 特定 情境 中 非 正式 信息 交流 的 内 
容 演化 ,有 关 主 题 和 主题 艇 演化 过 程 中 内 部 运行 情况 
的 微观 和 中 观 层次 分 析 较 为 缺乏 ;同时 主题 演化 情况 
的 测度 指标 着 重 讨论 主题 强度 量化 ,忽视 了 从 存续 时 


信息 交流 的 异步 会 话 过 程 展开 分 析 。 
2 相关 研究 


2.1 非 正式 信息 交流 中 的 主题 识别 与 演化 研究 
社交 媒体 平台 为 非 正式 信息 交流 中 用 户 、 互 动 关 
系 及 信息 流 的 研究 提供 了 理想 环境 "1 ,因此 网 络 环境 
下 非 正 式 信 息 交 流 人 研究 多 将 新 浪 微 博 、 知 乎 、Twitter、 
Facebook 及 在 线 论坛 等 作为 信息 交流 载体 和 实证 数据 
主题 识别 研究 ,依据 表示 方法 可 主要 分 为 三 类 : 
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@ 基 于 词 的 主题 表示 ,以 基于 加 权 算法 的 主题 识别 方 
法 为 代表 ,将 词 频 统计 结合 词性 . 逆 文 档 词 频 叫 等 计 
算 词 的 贡献 度 ,通过 排序 第 选 提取 主题 内 容 ;@ 基 于 词 
篮 的 主题 表示 ,以 基于 文本 聚 类 的 主题 识别 方法 为 代 
表 , 多 使 用 Word2vec 构建 特征 词 集结 合 K-means RX 
算法 5" 提取 文本 主题 ;@ 基 于 概率 分 布 的 主题 表示 ， 
使 用 主题 模型 识别 文本 主题 ,其 中 LDA 模型 因 具 有 优 
秀 的 数据 降 维 和 隐 含 语义 挖 据 能 力 ,被 应 用 于 多 项 研 
究 中 识别 社交 媒体 短文 本 主题 "9 。 此 外 ,社交 媒体 
中 大 量 非 文 本 特征 ,如 用 户 、 地 理 、 互 动 .时 序 等 ,也 补 
分 别 引入 主题 模型 所 或 结合 文本 内 容 特征 构建 超 网 络 
Eg" ,以 实现 主题 联合 挖 据 。 

主题 演化 研究 ,依据 演化 结构 可 主要 分 为 两 类 , 即 
韦 题 线性 结构 演化 和 主题 非 线性 结构 演化 。 其 中 ,前 
者 罕 主 题 演化 研究 早期 占 主流 地 位 "" ,主要 通过 主题 
内 斋 或 讨论 强度 在 时 间 轴 上 的 线性 演变 呈现 ,揭示 以 
是 为 表征 的 文本 内 容 时 序 变化 特征 与 规律 。 而 主题 
非 萤 性 结构 演化 研究 于 近年 来 逐渐 增多 王 ,借助 故事 
脉络 分 析 “ ”探究 主题 间 关系 的 演变 过 程 。 此 外 , 针 
对 SB 题 演化 的 发 展 阶段 ,相关 研究 通常 以 生命 周期 理 
iG: dn Eie MUERE ”、 五 段 论 ”等 多 
种 团 分 方式 。 主 题 演化 分 析 维 度 方面 ,不 同 研究 中 通 
it 和 空间 5 Jg om 等 维度 对 单一 时 序 加 以 拓展 ， 
或 桥 由 多 维特 征 整 合 2 等 方式 加 以 丰富 。 
XK 会 话 分 析 研究 
A 话 分 析 理 论 ( Conversation Analysis Theory ) , 分 
属 证 言 学 和 社会 学 两 个 学 科 领 域 。 其 中 ,语言 学 研究 
中 国会 话 分 析 , 强 调 语法 . 语 篇 . 话 轮 和 话题 等 语言 形 


( 
a 


式 与 功能 的 分 析 ” ;社会 学 研究 中 的 会 话 分 析 , 则 虽 
在 通过 发 现 人 类 言语 交际 的 规律 与 模式 阐释 其 背后 蕴 
含 的 社会 规律 与 社会 秩序 ”。 相 关 研 究 数据 主要 来 
自 非 正式 信息 交流 过 程 中 的 会 话 记录 ,可 分 为 线 下 会 
话语 料 和 线 上 会 话语 料 两 类 。 

线 下 会 话语 料 , 多 使 用 自然 或 半 实 验 环境 下 记录 
人 们 会 话 交流 的 音频 视频, 转换 为 文字 加 以 整理 形 
成 。 基 于 此 的 会 话 分 析 研 究 重点 关注 由 序列 结构 分 析 
反映 出 言语 交际 中 的 特征 与 规律 ,分 别 就 外 语 教 
学 、 医 患 交流 路 文化 工作 “等 具体 情境 以 及 协 
商 请 求 ” ,故事 讲述 ” 等 具体 行为 中 的 会 话 交流 展开 


得 益 于 互联 网 技术 发 展 ,网 络 环境 中 客观 记录 的 
海量 交流 数据 推动 着 基于 线 上 会 话语 料 的 会 话 分 析 研 
究 与 时 俱 进 \ 日 益 增 长 。 学 者 们 从 内 容 、 关 系 , 行 为 等 


多 个 维度 ,探究 学 术 虚 拟 社区 、 微 信 平 台 等 多 种 
社交 媒体 中 用 户 的 信息 交流 特征 。 此 外 ,分 别 对 多 模 
态 大 数据 环境 下 的 会 话 分 析 方 法 ”以 及 基于 会 话 分 
析 的 自然 语言 处 理 方法 ” \ 团 队 决策 支持 系统 等 加 
以 改进 优化 。 

综 上 所 述 ,主题 识别 研究 成 果 丰 富 ,为 文本 主题 分 
析 研 究 提 供 了 方法 和 技术 支持 。 主 题 演化 研究 从 演化 
结构 .发展 阶段 分析 维度 等 多 方面 得 以 深化 拓展 ,但 
也 存在 一 定局 限 : 中 分 析 层 次 相对 宏观 ,集中 于 以 主题 
为 表征 的 特定 情境 中 非 正 式 信息 交流 内 容 演化 ,有 关 
单个 主题 和 由 若干 关系 紧密 的 主题 所 组 成 的 主题 篮 在 
演化 过 程 中 的 内 部 运行 情况 的 微观 和 中 观 层次 分 析 较 
为 缺乏 。 外 主题 演化 情况 的 测度 指标 着 重 讨论 主题 强 
度量 化 计算 ,忽视 了 从 存续 时 间 角 度 对 主题 持续 性 的 
探究 。 会 话 分 析 研 究 提 供 了 基于 信息 交流 数据 分 析 揭 
示人 类 言语 交际 的 社会 学 规律 的 理论 依据 ,但 在 基于 
社交 媒体 的 非 正 式 信息 交流 分 析 中 的 应 用 尚 处 于 起 步 
阶段 。 因 此 ,本 研究 以 文本 主题 为 核心 ,将 会 话 分 析 结 
合 主题 分 析 , 则 在 基于 主题 和 主题 簇 运行 过 程 分 析 , 从 
微观 和 中 观 层面 揭示 非 正式 信息 交流 的 特征 与 规律 。 
同时 ,从 连贯 性 延续 和 间断 性 延续 两 方面 探讨 主题 持 
续 性 内 涵 ,并 基于 相对 讨论 强度 制定 持续 性 判断 标准 ， 
以 量化 分 析 主 题 演 化 情况 。 


3 ”基于 会 话 分 析 的 非 正 式 信息 交流 主题 
演化 分 析 框 架 


本 文 基 于 会 话 分 析 理 论 梳 理 主题 运行 过 程 并 界定 
其 中 各 类 运行 状态 ,进而 结合 发 文 数量 和 参与 人 数 指 
标 计算 主题 的 相对 讨论 强度 ,以 可 视 化 呈现 主题 运行 
过 程 及 衡量 主题 演化 过 程 中 的 持续 性 特征 。 通 过 主题 
运行 过 程 分 析 及 其 持续 性 测度 ,探究 社交 媒体 用 户 在 
主题 讨论 内 容 中 的 偏重 特点 。 

3.1 主题 运行 过 程 分 析 

在 包含 若干 时 间 片 段 的 时 间 区 间 中 ,主题 由 启动 
到 终止 的 运行 过 程 之 间 , 可 能 出 现 延续 、 沉 默 、 回 逆 等 
运行 状态 。 此 处 有 关 运 行 状 态 的 讨论 缘 限 定 在 一 定 范 
围 内 ,如 讨论 时 间 ,讨论 参与 者 等 。 主 题 运行 过 程 中 各 
种 状态 的 具体 描述 如 下 : 

(1) 主题 启动 。 指 的 是 由 一 名 用 户 发 文 提出 新 的 
讨论 主题 并 介绍 相关 内 容 , 可 能 引发 其 他 用 户 参 与 讨 
论 ; 

(2) 主题 延续 。 指 的 是 在 主题 启动 后 ,由 引入 该 
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主题 的 用 户 或 其 他 用 户 接连 发 文 ,以 深入 挖 气 或 延伸 
扩展 的 方式 ,持续 发 表 与 该 主题 有 关 的 看 法 ; 

(3) 主题 沉默 和 主题 回 逆 。 是 一 对 相辅相成 的 概 
念 , 指 的 是 主题 相关 发 文 在 某 一 个 时 间 片段 暂时 停止 ， 
但 在 其 后 处 于 研究 选 定 的 整体 时 间 范围 内 的 某 一 个 或 
某 几 个 时 间 片 段 ,该 主题 相关 发 文 再 次 出 现 ; 

(4) 主题 终止 。 指 的 是 与 这 一 主题 有 关 的 发 文 完 
全 结束 ,观测 范围 内 的 所 有 参与 者 不 再 发 表 该 主题 相 
关 讨 论 。 

社交 媒体 平台 中 ,不 同 主题 可 以 同时 被 同一 名 用 
户 发 文 讨论 ,同一 主题 可 以 同时 被 不 同 用 户 发 文 讨论 ， 
社交 媒体 中 不 同 主题 的 发 文 多 以 并 行 关系 呈现 ,每 个 
主题 的 运行 过 程 相对 独立 。 但 是 同时 , 受 有 限时 间 精 
力 的 影响 ,用 户 在 接收 .处理 与 表达 信息 过 程 中 具有 选 
择 己 ,导致 不 同 主题 之 问 存在 竞争 关系 ,竞争 获取 该 时 
间 轴 段 中 更 多 用 户 的 关注 与 讨论 。 因 此 ,探究 特定 时 
间 多 间 中 多 个 主题 的 运行 过 程 ,可 通过 计算 各 个 主题 
的 稻 对 讨论 强度 ,在 表现 主题 之 间 此 消 彼 长 关系 的 同 
时 s 份 析 主 题 讨论 焦 点 变化 和 判定 主题 持续 性 特征 , 揽 
元 阶 户 发 文 主题 在 内 容 方面 的 偏重 及 其 变化 。 

SAJ 主题 相对 讨论 强度 计算 

中 〇 当 某 一 个 主题 占据 了 当前 时 间 片 段 中 最 大 比例 的 
肝 站 发 文 讨论 条 目 时 ,其 他 主题 可 能 不 被 所 起 ,或 可 能 
被 祥 别 用 户 通过 少量 发 文 进行 有 限 的 讨论 。 若 在 下 一 
”请 问 片段 中 , 另 一 个 主题 取代 了 上 一 时 间 片段 中 最 
大 能 例 讨论 的 主题 ,成 为 了 这 一 时 间 片 段 中 用 户 讨论 
的 重心 ,关于 该 主题 以 及 其 他 主题 的 讨论 状态 ,同样 存 
在 葬 述 两 种 可 能 。 由 此 ,计算 某 一 主题 在 单个 时 间 片 
段 中 的 相对 讨论 强度 ,主要 考虑 围绕 这 一 主题 展开 讨 
论 的 用 户 数量 占 比 和 发 文 数 量 占 比 两 个 指标 。 具 体 计 
算 公式 如 下 所 示 : 


Topic _S h ( TP) = Count( Us) 
opic _ Strength ( TP? ) = Total. U, ) Q 十 
Count ( Post? ) 
Bd PASST 
Total Post, 公式 (1) 


HoP up dé 3S 4 tp 21,2 niti TERRI 
Bii ti 21,2, m; Count (Ug ) JITE Fr Bt i PS 
5j 3E tp 讨论 的 用 户 人 数 ,Count( Post) Jj tst [8] Hr Ez ti 
中 关于 主题 tp VHETIS Az SOUS , Total U, 7 SE [8] Fr Et ti 
中 进行 发 文 讨 论 的 用 户 总 人 数 ,Total_Posii 为 时 间 片 段 
龙 中 的 总 发 文 数量 ,a 和 表示 两 个 指标 对 于 主题 相对 
讨论 强度 的 影响 因子 。7P* 代 表 主 题 史 在 时 间 片 段 考 
中 的 相对 讨论 强度 , 取 值 范围 为 [0,1] , 若 TPR — 1 W 


表示 时 间 片 段 志 中 所 有 用 户 的 所 有 讨论 发 文 均 为 主题 
tp HAAR, Z TP =0 则 表示 时 间 片 段 契 中 没有 用 户 
RRE tp 相关 的 内 容 。 
3.3 ”主题 持续 性 及 其 判定 

主题 的 持续 性 ,表现 为 UGC 中 与 该 主题 相关 的 讨 
论 延续 于 被 观察 的 整个 时 间 区 间 , 可 从 连贯 性 延续 和 
间断 性 延续 两 种 方式 界定 。 其 一 ,连贯 性 延续 中 ,主题 
持续 性 表现 为 主题 相关 发 文 横 跨 整体 时 间 区 间 中 若干 
时 间 片 段 , 即 UGC 在 多 个 连续 时 间 片 段 中 均 涉 及 该 主 
题 。 其 二 ,间断 性 延续 中 , 主题 持续 性 表现 为 UGC xx 
本 流 上 若干 时 间 片 段 中 发 布 与 该 主题 相关 内 容 条 目 ， 
即 该 主题 相关 发 文 所 存在 的 时 间 片 段 数量 在 整体 时 间 
区 间 中 的 占 比 超过 设 定 阐 值 。 上 述 两 个 角度 均 从 时 间 
维度 出 发 衡量 用 户 对 某 一 主题 的 偏重 ,考虑 用 户 受 有 
限时 间 精 力 影 响 自发 筛选 可 能 接触 和 发 表 看 法 的 主题 
内 容 , 可 通过 每 个 时 间 片 段 中 的 相对 讨论 强度 计算 , 实 
现 主题 的 纵向 演化 分 析 和 横向 对 比分 析 。 

本 文选 择 从 存续 时 间 的 角度 ,采用 连贯 性 延续 的 
定义 方式 ,结合 相对 讨论 强度 计算 制定 主题 持续 性 判 
定 标准 , 即 在 整体 时 间 区 间 包 含 的 所 有 时 间 片 段 中 , 主 
题 的 相对 讨论 强度 均 大 于 0。 同 时 设立 一 个 例外 情 
况 , 即 若 某 一 主题 的 相对 讨论 强度 偶发 性 地 为 0, 仍 应 
将 该 主题 视 为 具有 持续 性 特征 。 相 对 而 言 ,主题 的 非 
持续 性 是 指 主 题 在 时 间 区 间 中 被 短暂 或 频繁 间断 地 发 
文 讨论 , 即 主题 仅 在 部 分 时 间 片 段 中 的 相对 讨论 强度 
大 于 0 ,而 在 其 他 时 间 片 段 中 相对 讨论 强度 为 0, 且 相 
对 讨论 强度 为 0 的 情况 是 非 偶发 性 的 。 


4 基于 语义 关联 过 滤 的 非 正 式 信 息 交 流 
EARRA 


HA TEHA ERRA ERR , CE T ESE 
媒体 用 户 围绕 某 一 事物 发 表 各 不 相同 但 又 隐 性 关联 的 
观点 视角 ,通过 对 主题 复 的 组 成 结构 .运行 过 程 及 主导 
主题 进行 分 析 可 综合 揭示 用 户 的 讨论 方式 特征 。 其 
中 ,主题 篮 内 部 呈现 出 的 运行 状态 ,可 揭示 主题 复 或 稳 
定 持续 或 扩展 丰富 、 或 收敛 衰退 的 变化 过 程 ;结合 簇 
内 各 主题 间 持 续 性 及 相对 讨论 强度 对 比 确定 的 主导 主 
题 ,可 反映 用 户 发 文中 或 丰富 多 元 或 聚焦 深入 的 讨论 
特征 。 因 此 ,为 有 效 提取 非 正式 信息 交流 中 的 主题 艇 ， 
本 文 首先 分 析 了 主题 相似 性 常用 计算 方法 的 适用 情 
况 , 其 后 设计 关联 过 滤 条 件 以 确定 候选 相似 主题 对 ,最 
后 探讨 完整 主题 簇 构成 条 件 。 
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4.1 主题 相似 性 计算 

为 衡量 主题 之 间 相似 性 , 需 首先 基于 TF-IDF 计算 
获得 表征 各 个 主题 核心 内 容 的 主题 词 集合 ,映射 至 语 
义 空间 得 到 相应 主题 向 量 以 进行 计算 ,主要 指标 如 余 
弦 相 似 度 KL 散 度 、 对 称 KL HUE JS 散 度 等 。 

其 中 ,余弦 相似 度 计算 方法 使 用 主题 向 量 之 间 的 
夹 角 余弦 值 度量 其 相似 性 ,要 求 两 个 主题 处 于 同一 语 
义 向 量 空间 。 主 题 7 与 主题 7 的 余弦 相似 度 ,通常 记 
为 Sim(7,,7,) ,具体 计算 公式 如 公式 (2) MR, RAH 
似 度 Sim(7,,7,) 的 值 越 大 ,主题 之 间 的 相似 性 就 越 大 : 
IT, x TI e 
Ta 公式 (2) 

若 两 个 主题 来 自 不 同 向 量 空间 , 则 通常 选择 KL 
ME XPK KL USE JS 散 度 等 ,基于 主题 概率 分 布 的 
距 完 测度 其 相似 性 ,以 相同 维度 的 概率 分 布 为 计算 前 
即 假定 p 是 主题 T, 的 概率 分 布 ,q 是 主题 7 的 概 
RIP p 和 g 中 的 概率 分 布 维度 , 即 词汇 总 数 , 均 需 为 
ngo EW T, 和 主题 T, 的 词汇 空间 不 相同 , 则 需 对 主 
题 概 率 分 布 的 来 源 词 表 进 行 合并 增补 ,以 保证 主题 概 
率 俏 布 中 相同 的 维度 数量 和 词汇 项 目 。 此 三 种 计算 方 
法 所得 结果 取 值 越 小 ,代表 主题 问 概 率 分 布 的 差异 性 
越 隐 ,两 个 主题 的 相似 性 越 大 。 
aN 相似 主题 对 选取 
.全 以 相似 性 计算 结果 为 基础 ,主题 间 相 似 关系 的 确 
REY E VERE RELIEF E DL RT FR M. n BRL p M HO 
主题 对 ,保留 真正 具有 相似 关系 的 主题 对 ,构成 候选 主 
B. 
《最 简单 直接 的 方式 是 选取 若干 对 相似 度 较 大 的 主 
题 , 求 取 它 们 的 相似 度 平 均值 并 设置 为 相似 主题 对 的 
判定 阔 值 。 显 然 ,这 种 方法 受 主观 影响 ,随机 性 较 大 。 
若 将 每 个 主题 与 其 他 主题 之 间 的 相似 性 大 小 进行 倒序 
排列 ,假设 对 于 T i 而 言 ,相似 度 最 大 的 是 主题 1, 即 
UX T, 和 7 之 间 存 在 主题 关联 , 则 可 能 导致 因 主题 之 
间 关 联 关系 纯粹 基于 最 大 相似 度 判定 和 构建 ,使 得 主 
题 之 间 实 际 关联 性 较 弱 的 情况 产生 。 因 此 ,需要 采取 
一 种 改进 的 关联 过 滤 方法 ,将 主题 7, 与 主题 7 的 语义 
相似 性 计算 结果 , 记 做 S(7 ,7 ) : 

(1) 设 定 一 个 临界 阔 值 s, 相 似 度 小 于 该 阔 值 的 主 
题 之 间 不 存在 相似 性 关联 关系 ; 

(2) 对 于 主题 7; 而 言 , 与 主题 7 MERT, eg 
在 大 于 临界 闭 值 的 相似 性 关联 , 若 相似 度 S(7;,7,) < 


Sim(T,,T,) = 


7, 之 间 的 相似 性 关联 关系 太 小 以 至 于 可 以 被 忽略 不 
Hs 

经 过 以 上 过 滤 处 理 后 ,可 将 具有 相似 性 关联 关系 
的 大 干 个 主题 对 所 组 成 的 集合 视 为 一 个 主题 子 集 , 即 
T.,T, e TC, 
4.3 ERREKI 

经 过 关联 过 滤 后 的 相似 主题 对 ,依据 其 间 相 似 关 
系 组 成 了 若干 个 主题 子 集 。 主 题 子 集 需 进一步 通过 判 
断 条 件 修剪 ,以 确保 簇 内 主题 之 间 有 具有 紧密 的 相似 关 
系 ,才能 最 终 确定 主题 复 提 取 结 果 。 判 断 主 题 子 集 是 
否 构成 一 个 完整 的 主题 复 , 可 以 考虑 以 下 三 种 判断 条 
ft: 

(1). 4 pl, — ^] EHIE P ES ee I ERR, DEP n [R] f 
需要 存在 相似 性 关联 关系 ; 

(2) 构 成 一 个 主题 复 中 的 各 个 主题 , 仅 需要 与 复 
内 至 少 一 个 其 他 主题 存在 相似 性 关联 关系 ; 

(3) 构 成 一 个 主题 篮 中 的 各 个 主题 之 间 存 在 的 相 
似 关系 数量 , 需 根据 簇 内 所 包含 的 主题 数量 分 情况 讨 
论 , 若 一 个 主题 篮 包 含 的 主题 数量 大 于 三 个 , 则 每 个 主 
题 需 与 主题 篮 内 至 少 三 个 其 他 主题 存在 相似 性 关联 关 
系 ; 帮 一 个 主题 篮 包 含 的 主题 数量 小 于 等 于 三 个 , 则 
个 主题 需 与 主题 篮 内 其 他 主题 两 两 之 间 存 在 相似 性 关 
联 关系 。 

其 中 ,前 两 种 限定 条 件 存在 因 过 于 严 苛 或 宽泛 可 
能 导致 主题 徐 的 规模 过 小 或 过 大 的 问题 ; 相 较 而 言 ,第 
三 种 判定 条 件 较 为 恰当 。 因 此 ,本 文选 用 第 三 种 判定 
条 件 对 所 得 主题 子 集 进行 修剪 以 确定 主题 篮 。 


5 实证 分 析 


5.1 数据 采集 与 预 处 理 

社交 媒体 中 高 影响 力 用 户 的 发 文 会 吸引 更 多 追随 
者 和 普通 用 户 的 关注 ,由 高 影响 力 用 户 组 成 的 意见 群 
体 通过 呼应 发 文 和 重复 曝光 ,引发 主题 关注 量 的 指数 
级 增长 ,进而 影响 网 络 熏 论 力 至 现实 事件 的 发 展 走向 。 
鉴于 此 ,对 高 影响 力 用 户 组 成 意见 群体 用 户 生 成 内 容 
UGC 的 主题 和 主题 秘 演 化 运行 过 程 进行 分 析 并 测度 
主题 持续 性 ,可 对 意见 群体 在 讨论 内 容 和 讨论 方式 等 
方面 的 特点 与 变化 进行 揭示 ,为 突 发 事件 应 对 、 网 络 与 
情 管理 等 情境 中 有 效 的 沟通 交流 策略 提供 参考 。 
本 文 首先 通过 梳理 现 有 研究 中 社交 媒体 用 户 影 响 
力 测度 指标 “构建 用 户 影响 力 评价 指标 体系 ,采用 


0x S(T,,T,) ,0 HRE WREE BHL, WER T, 与 主 
UT, 具有 更 强 相似 性 关联 , 相 较 之 下 主题 7, 与 主题 


层次 分 析 法 确定 指标 权重 ,分 别 识别 新 浪 微 博 和 知 科 
平台 中 参与 社会 焦点 事件 “ 江 歌 案 "讨论 的 高 影响 力 
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用 户 组 成 社交 媒体 平台 的 意见 群体 样本 ,采集 两 组 意 
见 群 体 为 期 37 个 月 的 发 文 作为 本 研究 实证 分 析 数 据 
来 源 。 其 后 ,清洗 发 文 数据 ,获得 新 浪 微 博 意见 群体 共 
计 124 556 条 有 效 发 文 数据 , 知 乎 意见 群体 共计 2 833 
条 有 效 发 文 数据 。 经 过 分 词 去 停 用 词 等 预 处 理 后 , 调 
用 百度 AI 的 词 向 量 表示 功能 并 结合 TF-IDF 计算 筛选 
每 篇 发 文 的 特征 词组 成 文本 向 量 ,使 用 Python 中 的 
Scikit-leam 函数 计算 误差 平方 和 与 轮廓 系数 确定 最 优 
主题 数量 K 值 ,通过 K_means 聚 类 得 到 70 个 新 浪 微 博 
意见 群体 主题 和 35 个 知 乎 意见 群体 主题 。 最 后 ,计算 
各 主题 类 团 中 关键 词 的 TF-IDF 值 并 将 降序 排名 前 10 
词语 作为 主题 词 描述 主题 内 容 , 并 参考 新 浪 微 博 与 知 
平 以 及 清 博 指数 . 知 微 事 见 等 与 情 网 站 和 人 民 网 .新 浪 
新 闻 等 新 闻 网 站 确定 主题 标签 ,以 方便 后 续 分 析 表述 。 
5.22 非 正式 信息 交流 主题 演化 分 析 
加 首先 ,依据 知 乎 和 新 浪 微 博 平台 来 源 实验 数据 的 
时 和合 分 布 特点 ,分 别 选择 适合 的 时 间 片 段 划 分 单元 。 
然 蝇 ,依据 主题 相对 讨论 强度 计算 公式 (公式 1) ,计算 
每 使 主题 在 各 个 时 间 片 段 中 的 相对 讨论 强度 。 最 后 ， 
主题 相对 讨论 强度 ,对 选 定 实验 时 间 跨 度 范围 内 
S 


持 破 性 展开 分 析 。 
N 98 主题 延续 
2 0.7 2 Pc 
>< 0.6 | | l 
S 0.5 | i 1 [^ | 
c 04 
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—6-— Topic 2 


图 1 新 浪 微 博 意 见 群体 主题 运行 过 程 示 例 


由 图 1 可 知 , 内 容 以 观点 评论 为 主 的 Topic36 TE 
个 时 间 区 间 内 具有 较 高 的 相对 讨论 强度 ,表现 出 明显 
的 持续 性 特征 ,反映 了 新 浪 微 博 意见 群体 对 个 人 观点 
意见 具有 持久 ,强烈 的 表达 欲望 。Topic2 和 Topic47 的 
相对 讨论 强度 整体 较 低 , 且 在 车 干 个 时 间 片 段 中 出 现 
主题 沉默 ,相对 讨论 强度 非 偶发 性 地 取 值 为 0, 不 具有 
持续 性 特征 。 其 中 ,Topic2 围绕 着 节日 红包 展开 ,周期 
性 的 主题 回 逆 表现 突出 ;Topic47 3:3 52r f 20 


—$— Topic 36 


就 在 线 主 题 讨论 而 言 ,由 多 名 用 户 发 文 讨论 点 的 
主题 ,通常 比 仅 被 少数 用 户 讨论 的 主题 更 为 活跃 .传播 
范围 更 广 。 因 此 , 主题 相对 讨论 强度 计算 公式 (公式 
(1) ) 的 两 个 影响 因子 a B 中 ,参与 用 户 指标 对 于 主 
题 相对 讨论 强度 的 影响 显然 要 大 于 相关 发 文 指标 , 同 
时 参考 已 有 研究 中 的 相关 设 定 , 令 a =0.6,B = 
0.4。 同 时 ,本 文 将 主题 相对 讨论 强度 为 0 的 “偶发 性 ” 
界定 为 1 次, 即 若 某 一 主题 的 相对 讨论 强度 仅 在 1 个 
时 间 片 段 中 取 值 为 0, 则 其 仍 被 视 为 具有 持续 性 。 

(1) 新 浪 微 博 中 的 主题 演化 分 析 。 新 浪 微 博 中 发 
文 较为 频繁 ,因此 本 文 分 别 考虑 以 天 和 以 周 为 单位 时 
间 片 段 进行 划分 。 若 以 天 为 单位 时 间 片 段 , 则 依据 本 
文 判定 标准 ,新 浪 微 博 意见 群体 主题 均 不 具备 持续 性 
特征 , 且 时 间 片 段 缺失 数量 较 多 。 因 此 ,本 文选 择 以 周 
为 单位 时 间 片 段 进行 新 浪 微 博 意 见 群 体 的 主题 演化 分 
析 , 为 期 37 个 月 的 整体 时 间 区 间 被 划分 为 161 个 时 间 
片段 ,后 文中 以 “TS + 编号 "表示 。 指 标 参数 经 统计 代 
入 相对 讨论 强度 计算 公式 (公式 (1) ) 中 ,得 到 新 浪 微 
博 中 各 个 主题 在 各 时 间 片 段 中 的 相对 讨论 强度 。 以 
Topic 2 „Topic 36 和 Topic 47 作为 示例 ,绘制 主题 运行 
过 程 ,如 图 1 所 示 : 


—4— Topic 47 


诈骗 安保 资金 案 有 关 , 作 为 由 高 影响 力 用 户主 导 和 推 
动 吸引 其 他 网 民 关 注 的 与 情事 件 , 其 相对 讨论 强度 的 
分 布 变化 呈现 出 较为 完整 的 生命 周期 过 程 。 即 Top- 
ic47 相关 的 发 文 从 曝光 相关 信息 (TS4) 开 始 , 随 着 事 
件 进展 接连 披露 相关 信息 并 延伸 相应 讨论 ;在 TS30 至 
TS39 和 TS49 至 TS65 期 间 达 到 主题 讨论 的 高 潮 阶 段 ， 
其 间 主 题 相对 讨论 强度 较 大 且 时 间 片 段 相 对 连续 ;此 
后 该 主题 发 文 星 现 频繁 的 沉默 与 回 逆 状 态 , 表 示 相 关 
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讨论 进入 衰退 期 ;最 后 在 TS132 及 其 后 进入 沉默 状态 ， 
直至 相关 讨论 彻底 结束 ,主题 终止 。 

(2) 知 乎 平台 中 的 主题 演化 分 析 。 基 于 知 乎 平台 
发 文 时 间 间 隅 特点 ,本 文 考虑 了 以 周 或 月 为 单位 时 间 
片段 的 划分 方案 。 若 以 周 为 单位 时 间 片 段 , 由 于 知 乎 
用 户 发 文 的 时 间 分 布 较为 稀疏 , 知 乎 意见 群体 主题 均 
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—@— Topic! — —$9— Topic 7 


MT 2 中 可 以 看 出 ,Topic7 在 启动 后 的 所 有 时 间 片 
局 能 相对 讨论 强度 均 大 于 0, 具 有 明显 的 持续 性 特征 ， 
f 祖 较 于 其 他 三 个 主题 更 加 被 意见 群体 发 文 所 偏重 ， 
枉 知 乎 意见 群体 从 法 律 角度 进行 专业 性 解读 的 特 
点 ;并 将 此 偏好 特点 延续 至 社会 焦点 事件 的 讨论 中 。 
EA C RNC caria 
M2 0 , KRA EE e Bep Bp lo gH Je c hie, 
出 蜗 有 持续 性 特征 ,表明 受 知 乎 平台 对 发 文 内 容 详尽 
解 千 的 鼓励 ,意见 群体 将 突 发 性 社会 焦点 事件 与 个 人 
长 期 兴 趣 爱 好 ( 如 文学 作品 ) 相 结合 以 表达 自身 观点 
的 特点 。 同 时 ,意见 群体 自 TS18 开始 发 文 参 与 社会 民 
EE E ( Topic17 ) 相关 讨论 ,尽管 在 初期 (TS19 和 
TS20 ) 出 现 短暂 沉默 ,但 后 续 时 间 片 段 中 的 相对 讨论 强 
度 较为 平稳 ,显示 出 该 意见 群体 逐步 发 展 出 对 社会 事 
件 的 讨论 参与 偏重 。 此 外 ,Topiel 在 多 个 时 间 片 段 中 
的 沉默 状态 和 在 TS18 及 其 后 时 间 片 段 中 频繁 的 沉默 
与 回首 交替 状态 , 均 显示 出 电影 娱乐 等 无 关 主题 不 是 
基于 社会 焦点 事件 讨论 形成 的 意见 群体 所 共享 的 集体 
偏好 ,该 类 主题 仅 代表 个 别 成 员 的 兴趣 爱好 且 通 党 不 
会 与 事件 信息 进行 关联 的 隐喻 表达 。 

依据 本 文 制定 标准 判定 ,新 浪 微 博 意见 群体 发 广 
中 共计 6 个 主题 具有 持续 性 特征 ,相应 主题 内 容 反 映 
出 该 平台 中 由 社会 焦点 事件 讨论 形成 的 意见 群体 对 于 
社会 事件 .社会 名 人 动态 与 访问 等 社会 类 主题 以 及 对 


—*— Topic 16 


不 具备 持续 性 特征 。 因 此 , 需 按 月 进行 划分 ,共计 37 
个 时 间 片 段 , 以 "TS + 编号 "表示 。 相 关 参 数 数 值 经 统 
计 代 入 公式 1 中 ,计算 知 乎 意见 群体 主题 在 各 时 间 片 
段 中 的 相对 讨论 强度 。 以 Topic 1 Topic7 , Topicl6 和 
Topic 17 作为 示例 ,绘制 主题 运行 过 程 ,如 图 2 所 示 : 


一 一 Topic 17 


2 ， 知 乎 意见 群体 主题 运行 过 程 示例 


政务 权威 信息 发 布 , 观 点 意见 与 情感 交流 等 主题 的 参 
与 偏好 。 知 乎 中 共计 3 个 主题 具有 持续 性 特征 ,揭示 
出 该 平台 意见 群体 参与 社会 焦点 事件 的 讨论 是 基于 对 
海外 留学 等 事件 相关 内 容 主题 的 日 常 关注 ,并 在 意见 
表达 时 结合 法 律 等 专业 特长 和 文学 等 兴趣 爱好 进行 解 
读 的 交流 内 容 特征 。 
5.3 非 正 式 信息 交流 主题 复 演 化 分 析 

主题 相似 性 计算 中 , 因 本 研究 中 主题 向 量 来 源 于 
同一 语义 空间 采用 余弦 相似 度 衡量 主题 相似 性 。 其 次 
关联 过 滤 中 ,临界 阐 值 s 的 取 值 范围 参考 现 有 研究 设 
4E 0.2 —0. 4; CIE HE LEE 0. 的 取 值 范围 ,相关 研究 中 
通常 被 设 定 在 0.5 - 0.7 之 间 … ,本 文 实验 分 别 计算 
了 新 浪 微 博 和 知 乎 中 9=0.7、9=0.65 和 9=0.6 三 种 
取 值 方 案 所 提取 的 候选 相似 主题 对 数量 ,依据 可 提取 
的 修 选 主题 簇 数 量 与 规模 确定 新 浪 微 博 中 9 =0.65 和 
知 乎 中 9 20.7 ,得 到 新 浪 微 博 意见 群体 发 文中 48 对 相 
似 主 题 和 知 乎 中 41 对 相似 主题 ,通过 可 视 化 工具 Ge- 
phi 绘制 主题 的 相似 关系 网 络 , 见 图 3。 

由 图 3 可 以 看 出 ,新 浪 微 博 意见 群体 主题 相似 关系 
中 ,Topic3 与 Topic42 之 间 存 在 明显 相似 关系 , 且 二 者 分 
别 与 Topic66 存在 较 强 相似 性 ,其 余 各 个 主题 之 间 的 相 
似 关系 较 弱 且 交 织 复杂 。 知 乎 意见 群体 主题 相似 关系 
中 ,Topic2 与 Topic22 之 间 存 在 明显 语义 相似 性 ,Topic3 
与 Topic26 .Topic10 与 Topic25 , Topicll 与 Topic25 之 间 
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(a) 新 浪 微 博 意见 群体 


(b) 知 乎 意见 群体 


图 3 主题 相似 关系 网 络 


匀 具 有 较 强 的 相似 性 ,各 个 主题 自然 而 然 地 形成 了 若 
下 全 较为 明显 的 主题 子 集 。 
T (1 ) 新 浪 微 博 中 的 主题 秘 演 化 分 析 。 依 据 4.3 小 
讨论 选用 的 主题 秘 提 取 条 件 ,本文 在 新 浪 微 博 意 
兄 禹 体 的 70 个 发 文 主题 中 共计 提取 14 个 主题 篮 ,其 
1 个 主题 簇 由 3 个 以 上 相似 主题 构成 ,其 余 5 个 
簇 分 别 由 3 个 相似 主题 构成 ,8 个 主题 簇 分 别 由 2 
代 相 似 主 题 构 成 。 构 成 主题 秘 的 不 同 主题 ,体现 出 意 
体 围绕 同一 议题 从 不 同 视角 出 发 进行 分 析 解 读 与 
意 则 表达 ,揭示 了 不 同 主题 之 间 在 UGC 蕴含 的 主观 认 
识 电 建立 的 隐 性 关联 ,有 助 于 对 意见 群体 发 文 讨论 的 
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—9— Topic 15 
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切入 角度 进行 更 加 丰富 且 深 入 的 理解 。 例 如 , dE BU 
1 共 包 含 了 9 个 主题 ,涉及 社会 .生活 政务 .时 政 、 突 
发 事件 等 多 类 主题 ,显示 出 新 浪 微 博 意见 群体 对 与 人 
民 群 众 日 常生 活 及 利益 息息相关 的 多 个 方面 内 容 的 关 
注 ; 构 成 主题 复 2 的 3 个 主题 主要 涉及 政务 和 时 政 类 
内 容 , 反 映 了 新 浪 微 博 意见 群体 在 对 政府 工作 动态 的 
关注 中 ,延伸 出 对 于 国内 城市 建设 与 管理 .国际 交流 与 
合作 等 的 讨论 。 以 主题 篮 2 为 例 ,绘制 其 中 主题 在 各 
时 间 片 段 中 相对 讨论 强度 的 变化 ,如 图 4 所 示 ,分 析 主 
题 簇 内 运行 过 程 中 各 主题 之 间 关 系 。 


| 
| In 
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一 一 Topic23 — ——— Topic 31 


4 新 浪 微 博 中 主题 复 2 运行 过 程 示例 


由 于 新 浪 微 博 中 时 间 片 段 较 多 且 该 主题 篮 内 各 主 
pii Md ad 导致 图 4 中 散 点 折线 的 交织 
杂 , 因 此 未 在 图 中 标识 出 各 种 运行 状态 。 可 以 看 出 ， 

x Topicl5 和 Topic31 在 多 数 时 间 片 段 中 呈现 延续 
状态 , 且 根据 相对 讨论 强度 值 的 变化 显示 出 两 个 主题 
交 蔡 占据 意见 群体 在 该 主题 篮 内 的 讨论 侧重 ; Topic23 
则 在 一 段 时 间 的 频繁 发 文 (TS1 至 TS32 ) 之 后 逐渐 消 


退 ,主题 运行 在 沉默 与 回 逆 两 种 状态 之 间 频 繁 转换 。 
在 分 析 所 有 新 浪 微 博 主 题 艇 的 运行 过 程 和 主导 主题 
后 ,可 以 发 现 绝 大 多 数 主题 簇 与 图 4 中 主题 徐 2 的 运 
行 状态 相似 ,其 中 由 多 个 活跃 主题 交替 主导 主题 徐 内 
讨论 揭示 出 新 浪 微 博 主题 禾 演 化 过 程 中 内 容 丰 寅 、 多 
元 的 特点 。 此 外 ,少数 仅 包 含 2 个 主题 的 主题 篮 呈 现 
出 由 1 个 主题 占据 绝 大 部 分 讨论 的 运行 状态 , 即 主题 
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fR 11.12 和 14, 其 运行 过 程 与 5.2 小 节 图 1 中 所 示 相 
似 。 

(2) 知 乎 平台 中 的 主题 秘 演 化 分 析 。 依 据 相同 主 
题 复 提 取 条 件 ,从 知 乎 意见 群体 的 35 个 发 文 主题 中 共 
计 提 取 11 个 主题 复 , 其 中 共 4 个 主题 艇 分 别 由 3 个 以 
上 相似 主题 构成 ,其 余 7 个 主题 篮 分 别 由 2 个 相似 主 
题 构 成 。 

构成 主题 簇 的 不 同 主题 同样 体现 出 知 乎 意见 群体 
从 不 同 视角 分 析 同 一 议题 的 解读 与 表达 特点 ,但 相 较 
于 新 浪 微 博 意 见 群 体 发 文 主题 复 涵 盖 内 容 较为 丰富 、 


呈现 出 横向 关联 特征 而 言 , 知 乎 意见 群体 发 文中 提取 
的 主题 复 在 涵盖 内 容 范围 上 相对 聚焦 呈现 出 纵向 深 
入 特征 。 以 包含 3 个 以 上 主题 的 主题 篮 为 例 ,主题 复 1 
主要 涵盖 影视 娱乐 内 容 ,主题 复 2 专注 法 律 专业 内 容 ， 


主题 3 聚焦 竞技 体育 内 容 , 主题 篮 4 偏重 社会 生活 内 
容 。 这 些 主题 篮 中 ,部 分 内 容 与 意见 群体 参与 社会 焦 
点 事件 讨论 中 选择 的 剖析 视角 相关 联 , 其 他 内 容 则 揭 
示 出 意见 群体 具有 较为 广泛 且 持 续 的 兴趣 爱好 。 以 主 
题 复 1 为 例 ,绘制 其 中 各 个 主题 的 相对 讨论 强度 的 变 
化 ,如 图 5 所 示 : 
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e 图 $ 知 乎 中 主题 复工 运行 过 程 示例 

CN 

* M E S 中 可 上 ,意见 群体 前 期 (TS1 至 TS17 

一 从 图 中 可 以 看 出 ,意见 群体 前 期 (TS1 至 ) 6 ”总结 与 展望 


讨论 以 Topicl6 为 主 ,间或 谈 及 其 他 主题 ,整体 内 容 较 
Aa an cn tu 
文 嗜 多 ,该 主题 簇 中 的 讨论 内 容 更 加 丰富 ;主题 包涵 盖 
内 容 随时 间 推 移 逐 渐 拓 展 丰富 的 这 一 特点 ,在 知 乎 意 
见 竺 体 发 文 数据 中 较为 普遍 。 具 体 运 行 过 程 中 , 则 发 
现 Topicl6 不 仅 具 有 持续 性 特征 , 且 在 多 数 时 间 片 段 中 
占据 了 所 述 主题 徐 讨 论 的 热点 地 位 。 其 余 主 题 的 运行 
过 程 中 , 均 存 在 或 短 或 长 时 间 的 沉默 期 和 沉默 与 回 逆 
之 间 频 繁 的 状态 切换 。 尽 管 Topic24 和 Topic29 在 
TS17 之 后 呈现 出 围绕 较 高 水 平 的 相对 讨论 强度 均线 
进行 波动 的 状态 , 且 在 个 别 时 间 片 段 中 居于 主题 徐 1 
的 热点 地 位 ,但 在 多 数 情况 下 Topicl6 EEUE 1 中 
的 核心 主题 。 在 分 析 所 有 知 乎 主题 篮 的 运行 过 程 和 主 
题 敌 内 主导 主题 后 ,可 以 发 现 各 知 乎 主题 禾 均 分 别 由 
一 个 主题 占据 主导 地 位 , 簇 内 其 余 主 题 或 存在 较 长 时 
间 的 沉默 期 或 在 沉默 与 回 逆 间 频繁 切换 ,整体 而 言 体 
现 出 知 乎 意见 群体 专注 聚焦 核心 主题 的 讨论 方式 特 
占 


^o 


本 文 引入 会 话 分 析 理 论 ,通过 分 析 主 题 和 主题 篮 
运行 过 程 揭示 非 正 式 信息 交流 的 微观 和 中 观 层面 的 演 
化 特征 与 规律 ,并 提出 主题 持续 性 探索 演化 分 析 衡 量 
标准 。 实 证 分 析 中 以 社会 焦点 事件 中 高 影响 力 用 户 构 
成 的 意见 群体 为 例 , 分 析 新 浪 微 博 和 知 乎 中 的 主题 和 
主题 簇 运行 过 程 ,揭示 意见 群体 在 非 正式 信息 交流 的 
主题 讨论 内 容 和 方式 上 的 偏重 特点 与 变化 趋势 ,以 期 
为 网 络 与 情 管 理 中 制定 有 效 沟通 交流 策略 提供 参考 。 

分 析 发 现 ,主题 持续 性 反映 了 意见 群体 在 该 主题 
内 容 上 的 明显 偏重 ,并 表明 了 意见 群体 在 社会 焦点 事 
件 讨论 中 意见 观点 的 主要 切入 角度 。 同 时 ,新 浪 微 博 
和 知 乎 意见 群体 在 具有 持续 性 特征 的 主题 之 间 存 在 的 
明显 差异 ,揭示 出 两 个 社交 媒体 平台 有 关 社 会 焦点 事 
件 讨论 中 高 影响 力 用 户 在 事件 相关 和 日 常 状态 的 UGC 
中 主题 内 容 角度 的 区 别 ,表示 二 者 在 网 络 环境 的 非 正 
式 信 息 交流 中 承担 的 角色 差异 。 由 候选 相似 主题 对 集 
合 形成 的 关系 网 络 展现 了 新 浪 微 博 中 内 容 交 织 复杂 、 
边界 模糊 与 知 乎 中 内 容 相 似 性 差异 明显 边界 清晰 的 
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特点 , 源 于 两 个 平台 中 UGC 发 文 特点 .主题 识别 方法 
等 多 重 因素 影响 ,在 此 情况 下 ,主题 禾 提 取 条 件 中 采用 
相似 关系 数量 判定 的 方法 有 助 于 完整 主题 复 的 准确 判 
定 。 同 时 ,主题 篮 运 行 过 程 分 析 ,展现 了 新 浪 微 博 意见 
群体 在 一 定 范围 内 发 散 探索 不 同 主题 , 知 乎 意见 群体 
始终 关注 聚焦 核心 主题 的 讨论 特点 。 

本 文 研究 还 存在 一 定局 限 与 不 足 , 后 续 研 究 中 可 
从 以 下 两 个 方面 进行 完善 :其 一 ,从 间断 性 延续 的 角度 
探讨 主题 持续 性 ,并 与 本 文 研究 中 的 连贯 性 延续 进行 
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Abstract: | Purpose/significance | Aiming at the limitations of current informal communication topic evolution 

c in both analysis level and measurement indicators, a universal evolution analysis method is proposed to ex- 
plore the characteristics and patterns of topic evolution from micro and medium levels. | Method/process | Introdu- 
cing the conversation analysis theory, taking Sina Microblog and Zhihu as examples, this paper revealed the evolu- 
tionary characteristics and patterns of informal information communication from the two dimensions of conversation 
content and discussion style through the analysis of running process of topics and topic clusters. Meanwhile, this pa- 
per designed the method of calculating and judging the continuity of a topic and explored measurement standard of the 
topic evolution. | Result/conclusion | The topic evolution analysis results show that the opinion group from Sina Mi- 
croblog and Zhihu are obviously biased in topic content, and indicate the main perspectives of opinion group partici- 
pating in the discussion of social focus event. The topic cluster evolution analysis find out that opinion group from Si- 
na Microblog diversify and explore multiple topics in a certain range, while those from Zhihu always focus on the set- 
tled core topics. The difference in conversation content and discussion style between opinion groups in social media 
indicates the different role of Sina Microblog and Zhihu in informal information communication online. 
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